
GeminiAPI可使用原生文字轉語音(TTS)生成功能,將文字輸入內容轉換為單人或多人語音音訊。文字轉語音(TTS)生成功能可控,也就是說,你可以使用自然語言建構互動,並引導音訊的風格、口音、語速和語氣。,在本課程中,您將使用Speech-to-TextAPI將音訊檔案轉錄成文字...
Speech-to-Text API: speech recognition and transcription
LearnhowtousetheSpeech-to-TextAPIfromwithintheGoogleCloudconsolebycreatinganaudiotranscriptioninjustafewsteps.
** 本站引用參考文章部分資訊,基於少量部分引用原則,為了避免造成過多外部連結,保留參考來源資訊而不直接連結,也請見諒 **